大数据乱讲

张茂森

Oct 28, 2016

什么是大数据

无图无真相

大数据生态图

Gartner的定义

“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产

个人观点

“大数据”不是“数据”,如同“所有人”不是“人”

量变会产生质变

  • “所有人”==“社会”
  • “社会”的两个关键结构
    1. 量足够大、足够乱、足够多样的“人”集合
    2. 进化出来的社会关系和社会制度

大数据的关键结构

  1. 量足够大、足够乱、足够多样的“数据”的集合
  2. 进化出来的数据治理体系和规则

我对大数据的阐述

  1. 为了共同利益和目标的数据联盟
  2. 海量的、多样的、多变的数据集合和计算模式
  3. 在数据集合上进化出来的各种稳定的数据治理关系

大数据的构建方法

阿里巴巴的实践

  • 淘宝驱动出的CEO战略
  • “联盟”的进与退
  • 数据平台团队的工作

一个具有灵魂的数据集合–“阿里大数据

百度的实践

  • 百度旗下数据尚未汇总成一个大的联盟
    • 而是割裂的强势藩国
  • 百度的数据战略是应用驱动
    • 缺乏顶层设计,最后成为烟囱般的工具集

尚未构建起一个可供它持续创新,拥有灵魂的数据集合

成功构建大数据的关键要素

  1. 高效的藩篱破除机制-CEO战略
  2. 赋能心态
  3. 通畅的关联协作平台
  4. 分布式的自治能力
  5. 利益驱动的公共治理服务

大数据核心基础设施

  1. 计算设施
  2. 治理设施:
    面向数据治理和关联的协作平台
  3. 工具集成:
    面向应用赋能的工具集成平台。

我的方法论

  • 计算模式是云计算的事情
  • 数据的治理成为大数据的核心
  • 大数据从理科问题变成社科问题

大数据的未来

数据正在成为垄断资源

  1. Baidu有最大的人和咨询的关系
  2. Ali有最大的人和人的商业关系
  3. Tencent有最大的人和人的社交和娱乐关系
  4. 新美大有最大的人和线下服务的关系

但是每一家都把数据作为“黄金”一般来看护

数据堂的启示

  • 数据堂的创新:数据众包
    1. 向个人付费收集各种数据
    2. 卖给企业
  • 这种蚂蚁雄兵模式,可能能构建一张前所未有的大数据商业网络。

互联的力量

互联会产生质变

互联网 = 人的各种需求的互联网络

大数据 = 数据的互联网络

云计算 = 计算能力的互联网络
> 云计算其实才是目前最成功的物联网案例

根云的目标

相信互联的力量,让尽可能多的机器互联起来